บทความนี้จะพามารู้จักกับวิธี reinforcement learning อีกแบบหนึ่งนอกจากพวก Q-learning โดยที่ในบทความนี้จะเป็นการ introduce ตัว policy-based reinforcement learning ตั้งแต่ทฤษฏีไปจนถึง coding ง่าย ๆ เพื่อทำงานทดลอง
30 July 2020
บทความนี้จะพูดถึงวิธีการที่ชื่อว่า facenet ซึ่งเอาไว้หา representative vector ของใบหน้าคนด้วยการใช้ triplet loss ซึ่งเราสามารถนำ representative vector นั้นไปทำอะไรต่อได้หลายอย่าง เช่น เอาไปเทียบกันระหว่างสองหน้าแล้วดูว่าเหมือนกันรึเปล่า
25 July 2020
บทความนี้จะพูดถึง extension ของ DQN ที่ชื่อว่า Dueling DQN ซึ่งจะช่วยให้ DQN เรียนรู้ได้เร็วขึ้นด้วยการเรียน value function ของ state และเรียน advantage function แยกกัน เพื่อให้หลาย ๆ action สามารถแชร์ value function กันได้
18 July 2020
บทความนี้พูดถึงวิธีการ augment Data ที่ถูกนำเสนอในเปเปอร์ 'mixup: BEYOND EMPIRICAL RISK MINIMIZATION' ซึ่งจะช่วยให้โมเดลเราทำงานกับข้อมูลแบบ in-between sample (ข้อมูลที่อยู่กึ่งกลางระหว่างสองคลาส) ได้ดีขึ้น ช่วยลดปัญหา overfit ด้วยวิธีง่าย ๆ แต่ใช้ได้จริง
16 July 2020
บทความนี้สรุปมาจากเปเปอร์ 'Deep Clustering for Unsupervised Learning of Visual Features' ซึ่งนำเสนอวิธีในการ classify image โดยที่เราไม่ต้องใช้ labels
3 June 2020
บทความนี้จะพูดถึงการหาว่าแต่ละฟีเจอร์ส่งผลต่อผลการทำนายของแต่ละ instance อย่างไรบ้างด้วยการใช้ LIME
3 June 2020
บทความนี้จะพูดถึง Deep Q-Learning ซึ่งเป็นพัฒนาการสำคัญจาก Q learning โดยการใช้ neural network ในการประมาณค่า Q value แทนที่การเก็บค่า Q ในตาราง
3 June 2020